检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 面向混叠文字检测的单向投影Transformer方法

冯智达, 陈黎

《计算机应用》唯一官方网站 2022, 42 (12): 3686-3691. DOI: 10.11772/j.issn.1001-9081.2021101749

摘要（341）

HTML （23）

PDF （2574KB）（152）

针对基于分割的文字检测方法在混叠文字场景下性能下降的问题，提出了单向投影Transformer （SDPT）用于混叠文本检测。首先，使用深度残差网络（ResNet）和特征金字塔网络（FPN）提取并融合多尺度特征；然后，利用水平投影将特征图投影成向量序列，并送入Transformer模块进行建模，以挖掘文本行与行之间的关系；最后，使用多目标来进行联合优化。在合成数据集BDD-SynText和真实数据集RealText上进行了大量实验，结果表明，所提SDPT在高混叠度的文字检测下取得了最优的效果，而与PSENet等文本检测算法在相同骨干网络（ResNet50）条件下相比，在BDD-SynText上F1-Score（IoU75）至少提高了21.36个百分点，在RealText上的F1-Score （IoU75）至少提高了18.11个百分点，验证了所提方法对于混叠文字检测性能改善的重要作用。

图表 | 参考文献 | 相关文章 | 多维度评价